کاربرد رگرسیون مولفه های اصلی برای مجموعه داده های با مشاهدات دورافتاده و گم شده
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - دانشکده علوم پایه
- نویسنده راضیه فرمانی اردهایی
- استاد راهنما مسعود یارمحمدی
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1390
چکیده
در این تحقیق به بررسی داده های با بعد بالا، که شامل داده های دورافتاده و گمشده می باشند، پرداخته می شود. روش های مختلف رگرسیون مولفه های اصلی که می توانند در صورت وجود داده های دور افتاده و گم شد ه استوار باشند بررسی می شود. سپس رگرسیون مولفه های اصلی استوار به عنوان روش رگرسیونی که بخاطر بعد بالا در متغیرهای پاسخ و پیشگو از روش تعقیب تصویر و تحلیل مولفه های اصلی برا ی کا هش بعد استفاده می کند ، و در برابر داده های دور افتاده وگم شده استوار می باشند را شرح می دهیم. سپس با استفاده از روشهای شبیه سازی برازش مدلهای رگرسیونی به داده هایی که با داده های دور ا فتاده و گم شده آلوده شده ا ندرا مورد بحث قرار می دهیم. در پایان با مقایسه روش های مختلف رگرسیونی برازش شده به داده های شبیه سازی شده، روش استوارتر در مقابل داده های دور افتاده و گم شده معرفی می گردد.
منابع مشابه
شناسایی نقاط دورافتاده در داده های نرمال بر اساس مقادیر Z اصلاح شده مشاهدات
در این مقاله، به دلیل اهمیت و گستردگی استفاده از توزیع نرمال، نمونه های مبتنی بر این توزیع در نظر گرفته شده، با استفاده از مقادیر برش وابسته به حجم نمونه، نقاط دورافتاده آنها شناسایی می شوند. برای به دست آوردن مقادیر برش بهینه یک مسا له تصمیم مطرح و به روشی کمبیشینه (مینیماکس) حل می گردد. در حل این مسا له از روش شبیه سازی بهره گرفته شده است .
متن کاملتعیین نقاط دورافتاده ، مشاهدات با نفوذ و برآورد نیرومند برای مولفه های اصلی
تجزیه مولفه های اصلی یکی از روشهای چندمتغیره است که هدف آن یافتن ترکیباتی از p متغیر xp,...,x2,x1 جهت ایجاد شاخصهای غیرهمبسته zp,...,z2,z1 می باشد که این شاخصها به ترتیب بیشترین تغییرات را شامل می شوند.
15 صفحه اولتحلیل استوار داده های فضایی در حضور داده های دورافتاده
معمولاً تابع تغییرنگار که ساختار همبستگی دادههای فضایی را تعیین میکند و نقش پایه ای در تحلیل آنها دارد، نامعلوم است و لازم است براساس مشاهدات برآورد شود. وجود داده های دورافتاده در مشاهدات تاثیر نامناسبی در برآورد تغییرنگار و سایر بخشهای تحلیل دادههای فضایی همچون پیشگویی فضایی و برآورد پارامترهای روند دارد. در این مقاله ابتدا با استفاده از برآوردگرهای مقیاس، چند برآوردگر استوار جدید با ن...
متن کاملمدل رگرسیون لجستیک چند حالته با مقادیر گم شده و کاربرد آن در بررسی بیماری گواتر
In large–scale sampling opeartions (e.g. nation-wide health surveys) we always face the problem of non-response item(s) and/or non-response unit(s). In fitting a model to the data we have two groups of variables, namely dependent and independent variables. Non-response may occur for any of these groups of variables. In this paper we assume Y as a categorical dependent variable with three levels...
متن کاملآزمون تعیین خطای مشخص سازی مدل خطی عام برای داده های گم شده
در این مقاله مدل خطی عام را در تحلیل دادههایی که در آنها متغیرهای کمکی و متغیر پاسخ گم شدگی دارند، در نظر می گیریم. برای تعیین نیکویی برازش مدل خطی عام در حضور دادههای گمشده، آزمون جدیدی را بر اساس آزمون رمزی(1969) می سازیم. نشان می دهیم که تحت فرض صفر، آماره های آزمون در برخی از حالات از توزیع فیشر تبعیت می کند و در برخی از حالات به توزیع شبهفیشر میل میکند. علاوه بر این، عملکرد آمارههای آ...
متن کاملشناسایی نقاط دورافتاده در داده های نرمال بر اساس مقادیر z اصلاح شده مشاهدات
در این مقاله، به دلیل اهمیت و گستردگی استفاده از توزیع نرمال، نمونه های مبتنی بر این توزیع در نظر گرفته شده، با استفاده از مقادیر برش وابسته به حجم نمونه، نقاط دورافتاده آنها شناسایی می شوند. برای به دست آوردن مقادیر برش بهینه یک مسا له تصمیم مطرح و به روشی کمبیشینه (مینیماکس) حل می گردد. در حل این مسا له از روش شبیه سازی بهره گرفته شده است .
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - دانشکده علوم پایه
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023